فیلترها/جستجو در نتایج    

فیلترها

سال

بانک‌ها




گروه تخصصی











متن کامل


اطلاعات دوره: 
  • سال: 

    1387
  • دوره: 

    -
  • شماره: 

    34 (ویژه نامه مهندسی برق)
  • صفحات: 

    13-27
تعامل: 
  • استنادات: 

    0
  • بازدید: 

    2085
  • دانلود: 

    396
چکیده: 

حالت گفتار سبب افزودن اطلاعات اضافی نسبت به اطلاعات نوشتاری می شود. از طرف دیگر، وجود حالت در گفتار سبب بروز مشکل در فرایند بازشناسی گفتار می شود. در تحقیقات قبلی نشان داده شد که حالت گفتار سبب تغییرات اساسی در پارامترهای گفتاری می شود.برای بهبود نتایج بازشناسی گفتار با حالت، ابتدا باید تاثیر آن را بر پارامترهای گفتاری به دست آورد و در مرحله بعدی، از پارامترهای مناسبی برای بهبود نتایج بازشناسی استفاده کرد. در این تحقیق با توجه به نتایج به دست آمده در زمینه تاثیر حالتهای گفتاری خشم و اندوه بر پارامترهای گفتاری نظیر فرمنت ها و فرکانس گام در زبان فارسی، بهبود نتایج بازشناسی گفتار با حالت، با مدل های عادی مد نظر است. با توجه به تغییرات منظم پارامترهایی نظیر فرکانس گام، فرمنت ها و شیب آنها با حالت گفتار، این پارامترها به بردار ویژگی سیستم بازشناسی اضافه می شوند. این کار سبب بهبود نتایج بازشناسی می شود. میزان این بهبود بستگی به نوع پارامتر، تعداد مخلوط ها و حالت گفتار دارد. با توجه به اهمیت شناسایی حالت گفتار و همچنین نقش آن در بهبود کیفیت سیستم بازشناسی گفتار، با استفاده از فرمنت ها و فرکانس گام به عنوان ویژگیهای ورودی و به کارگیری روشهای درخت تصمیم گیری و GMM، کار شناسایی حالت گفتار نیز انجام شده است.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 2085

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 396 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesاستناد 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمرجع 0
نشریه: 

زبان پژوهی

اطلاعات دوره: 
  • سال: 

    1401
  • دوره: 

    14
  • شماره: 

    44
  • صفحات: 

    59-85
تعامل: 
  • استنادات: 

    0
  • بازدید: 

    301
  • دانلود: 

    111
چکیده: 

شنونده برای دست یابی به مرز واژه­, ها در گفتار پیوسته از الگوهای مختلف زبان­, شناختی مانند الگوهای واجی، صرفی-نحوی، معنایی و موارد مشابه استفاده می­, کند. بر مبنای فرضیه تقطیع عروضی، در صورت نبود منابع اطلاعاتی زبان شناختی، شنونده فقط به تغییرات نوایی برای بازشناسی مرز واژگانی تکیه می­, کند. در این پژوهش، برای ارزیابی میزان اعتبار فرضیه تقطیع عروضی، یک آزمایش ادراکی انجام دادیم تا فارسی ­, زبانان بومی، واژگان طبیعی فارسی را از زنجیره­, های آواییِ بی­,معنا (ناواژه­, ها) بازیابی کنند. یافته های به دست آمده با تأیید فرضیه تقطیع عروضی نشان داد تکیه در بازشناسی واژگان فارسی از گفتار پیوسته نقش به سزایی دارد زیرا شنونده­, ها واژگان معنادار فارسی را از ناواژه­, های تکیه-پایانی نسبت به ناواژه­, های تکیه-آغازی و تکیه-میانی با سطح اطمینان بالاتر و در مدت زمان کوتاه ­, تری تشخیص می­, دهند. همچنین، هر اندازه الگوی تکیه ناواژه­, ها با الگوی توزیع تکیه در واژگان طبیعی فارسی هماهنگ ­, تر باشد، سطح اطمینان پاسخ­, های شناسایی بالاتر و سرعت پردازش ادراکی واژگان سریع­, تر است. در مقابل، هر اندازه تکیه ناواژه­, ها با الگوی تکیة واژگانِ طبیعیِ فارسی ناهماهنگ ­, تر باشد، سطح اطمینان پاسخ­,ها پائین ­, تر و مدت زمان واکنش شنونده ­, ها کندتر است.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 301

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 111 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesاستناد 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمرجع 0
اطلاعات دوره: 
  • سال: 

    1380
  • دوره: 

    3
  • شماره: 

    2-1 (پیاپی 10)
  • صفحات: 

    15-20
تعامل: 
  • استنادات: 

    0
  • بازدید: 

    1180
  • دانلود: 

    0
کلیدواژه: 
چکیده: 

یادگیری زبان یک فرایند پردازش اطلاعاتی است. در واقع زمانی که گفته دیگران را می شنویم، کلمات موجود در گفتار پیوسته را بازشناسی می کنیم. بنابراین بازشناسی، شامل یافتن کلمات مجزا در گفتار پیوسته و نگاشت آنها به مدخل های واژگانی موجود در حافظه به منظور تعیین معنای کلمات می باشد. در توجیه فرایند بازشناسی کلمات گفتار، انگاره های متعددی ارایه شده و زبان شناسان بسیاری نیز در این حوزه فعالیت و تحقیق نموده اند؛ از جمله کاتلر، دنیس نوریس و جیمز مک کوئین که در تحقیقات بسیاری این انگاره ها را در زبان های مختلف مانند انگلیسی و ژاپنی آزموده اند. این مقاله، به معرفی چهار انگاره اصلی بازشناسی کلمه یعنی کوهورت، ردیابی، سیاهه کوتاه و تقطیع عروضی و بررسی رفتار کودکان فارسی زبان در بازشناسی کلمات گفتار از رهگذر این انگاره ها و همچنین شناسایی عوامل موثر در بازشناسی می پردازد.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 1180

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesاستناد 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمرجع 1
مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources
اطلاعات دوره: 
  • سال: 

    1386
  • دوره: 

    13
تعامل: 
  • بازدید: 

    421
  • دانلود: 

    242
چکیده: 

در یک سیستم بازشناسی گفتار به دلایل مختلف ممکن است لغات به اشکال گوناگون تلفظ شوند. در بازشناسی گفتار محاوره ای میزان تغییرات تلفظی افزایش می یابد و از آنجا که وجود تغییرات تلفظی ممکن است سبب رخداد خطا در سیستم بازشناسی گفتار شود، مدل کردن این تغییرات به عنوان راهی برای بهبود دقت سیستم بازشناسی گفتار مورد توجه قرار گرفته است. در این مقاله نتایج بازشناسی گفتار بعد و قبل از اعمال مدل کردن تغییرات تلفظی به شکل ضمنی و در سطوح مختلف در سیستم بازشناسی گفتار برای مجموعه دادگان فارس دات کوچک مورد بررسی قرار گرفته است. با مدل کردن ضمنی تغییرات تلفظی با در نظر گرفتن چند گوسی در هر حالت و به کار بردن واحد آوایی سه واجی در سطح مدل آکوستیکی و واژگان دقت بازشناسی %83.2 است. در حالی که بدون مدل کردن این تغییرات دقت سیستم حدود 71% است که این مطلب گویای اهمیت توجه به مدل کردن تغییرات تلفظی در سیستم های بازشناسی گفتار، به خصوص در مورد مجموعه دادگانی است که گفتارهای محاوره ای در آنها زیاد است.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 421

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 242
نویسندگان: 

باباعلی باقر

اطلاعات دوره: 
  • سال: 

    1395
  • دوره: 

    13
  • شماره: 

    3 (پیاپی 29)
  • صفحات: 

    51-62
تعامل: 
  • استنادات: 

    0
  • بازدید: 

    771
  • دانلود: 

    146
چکیده: 

علی رغم بیشینه سی ساله پژوهش در حوزه بازشناسی گفتار فارسی در ایران و دست یافتن به پیشرفت های در خور توجه، نتایج عمده کارهای انجام شده به دلیل عدم وجود بستر یکسان، قابل مقایسه و ارزیابی دقیق نیستند. بستر عمدتاً شامل سیستم بازشناسی و دادگان با تعریف مشخص مجموعه های آموزش، توسعه و ارزیابی می باشد. سیستم متن باز کلدی با وجود نوظهور بودن آن دارای ویژگیهای منحصر بفردی است که در سال های اخیر مورد توجه اکثر آزمایشگاه های تراز اول پردازش گفتار دنیا قرار گرفته است و با لحاظ همه جوانب بهترین انتخاب موجود در راستای پایه گذاری این بستر برای تمامی زبان ها از جمله زبان فارسی است. در این مقاله پس از بررسی خصوصیات، توانمندیها و اجزاء مختلف نرم افراز کلدی؛ دادگان فارس دات را به دلیل ثبت رسمی و قابل دسترس بودن آن برای همگان از سراسر دنیا به عنوان بخش دیگر این بستر انتخاب کرده و به تاسی از انتخاب انجام شده بر روی دادگان TIMIT به تعریف مجموعه های آموزش، توسعه و ارزیابی می پردازیم. در نهایت اکثر قریب به اتفاق تکنیک ها و روش های موجود در کلدی بر روی دادگان فارس دات، مطابق تعریف صورت گرفته، مورد آزمایش قرار گرفته اند. بهترین میزان خطای حاصل در بازشناسی واج برای مجموعه توسعه 20. 3 درصد و برای مجموعه آزمون 19. 8 بوده است. دسترسی به کدهای نوشته در جهت فراهم سازی این بستر، در نرم افزار کلدی موجود است که با توجه به متن باز بودن آن، دسترسی به آنها به منظور بازسازی نتایج آمده در این مقاله در صورت در اختیار داشتن دادگان فارس دات براحتی قابل انجام است.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 771

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 146 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesاستناد 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمرجع 0
نویسندگان: 

صادقی وحید

اطلاعات دوره: 
  • سال: 

    1398
  • دوره: 

    16
  • شماره: 

    4 (پیاپی 42)
  • صفحات: 

    135-149
تعامل: 
  • استنادات: 

    0
  • بازدید: 

    457
  • دانلود: 

    153
چکیده: 

یکی از فعالیت های شناختی پیچیده در چارچوب نظام آوایی زبان این است که اهل زبان قادرند گفتار پیوسته را به صورت زنجیره واژگان گسسته درک کنند. یافته های پیشین مطالعات آزمایشگاهی بر روی زبان فارسی و دیگر زبان ها نشان داده است، در زبان هایی که در آنها تکیه به طور ثابت (یا با فراوانی وقوع زیاد) در مرز آغازی یا پایانی واژه قرار می گیرد، شنونده ها از نشانه های آکوستیکی تکیه برای تقطیع گفتار پیوسته به واژگان سازنده آن استفاده می کنند. همچنین، این گونه فرض شده است که حضور تکیه در جایگاهی غیر از مرز آغازی یا پایانی واژه مانع از کارکرد مرزنمایی این عامل نوایی می شود. در زبان فارسی حضور واژه بست در واژه باعث می شود که تکیه در جایگاهی غیر از پایان واژه واقع شود. پژوهش حاضر با هدف پاسخ گویی به یک سوال اساسی درباره نحوه پردازش درکی گفتار پیوسته فارسی انجام شد: آیا مرز پایانی واژگان (اعم از واژگان حاوی واژه بست و واژگان فاقد واژه بست) با توجه به ساخت نواختی واژگان در دستور واجی آهنگ فارسی برای شنونده قابل شناسایی است؟ برای این منظور دوآزمایش شنیداری انجام شد. نتایج این آزمایش ها نشان داد که شنونده هر نقطه پایانی H (در یک گستره نواختی H) در منحنی آهنگ گفتار فارسی را به صورت مرز پایانی یک واژه شناسایی می کند. همچنین نتایج به دست آمده نشان داد که درک شنیداری الگوی برجستگی نوایی وابسته به محل وقوع قله H تکیه زیروبمی است.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 457

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 153 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesاستناد 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمرجع 0
مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources
اطلاعات دوره: 
  • سال: 

    1380
  • دوره: 

    10
تعامل: 
  • بازدید: 

    522
  • دانلود: 

    135
چکیده: 

در اینجا یک مدل وقایع گسسته برای بازشناسی گفتار پیوسته فارسی مستقل از گوینده ارایه شده است. در این مدل شبکه عصبی جلو سوی با تاخیر زمانی TDNN با دو لایه پنهان برای بازشناسی وقایع صوتی سیگنال گفتار تعلیم داده شده است.وقایع (events)، اتفاقات گذرا و لحظه ای خاصی هستند که در سیگنال صحبت رخ می دهند و حاوی اطلاعات قابل توجهی می باشند. در تعریف آنها از تجربیات زیست شناختی و عصب شناختی شنوایی و همچنین اطلاعات زبانشناختی و بررسی نحوه تولید آواهای زبان فارسی استفاده شده است.علاوه بر آن با تحلیل خطاهای سیستم های بازشناسی بر پایه فریم و یا بر پایه بازشناسی مرز واجها و انجام آزمایشات ریاضی مختلف بر روی پارامترها سعی شده کلاسهای مختلف وقایع به گونه ای معرفی شوند که بیانگر نواحی گذرا و سریع سیگنال باشند و تناقضات موجود در نحوه برچسب دهی واحدها که مانع از یادگیری کامل شبکه ها می شدند را نیز برطرف کنند.در آزمایش از دادگان فارس دات و پارامترهای LHCB استفاده شده است و میزان صحت شناسایی وقایع توسط برنامه استاندارد NIST استخراج شده که نتایج در مقایسه با سایر روشها امیدوار کننده است.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 522

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 135
اطلاعات دوره: 
  • سال: 

    1383
  • دوره: 

    15
  • شماره: 

    1
  • صفحات: 

    195-208
تعامل: 
  • استنادات: 

    0
  • بازدید: 

    967
  • دانلود: 

    0
چکیده: 

این مقاله به بررسی یک مدل آماری زبان بر اساس دستجات منطقی دستوری زبان فارسی برای استفاده از بازشناسی گفتار پیوسته می پردازد. این مدل زبان بر اساس دستجات منطقی N- گرام با طول متغیر کار می کند و در آن بجای پیدا کردن الگوهای آماری مربوط به دنباله های کلمات، روابط بین دسته های منطقی از کلمات، مورد بررسی قرار می گیرند. این تحقیق در سه مرحله خوشه بندی کلمات، بدست آوردن مدل آماری زبان با استفاده از ساختار درختی و اعمال مدل زبان به سیستم بازشناسی انجام شده است. مهم ترین مزیت این مدل امکان پذیرسازی بازگشت به مسیر صحیح در شرایط که مدل آماری معمولی چنین اجازه ای را نمی دهد، می باشد.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 967

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesاستناد 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمرجع 0
اطلاعات دوره: 
  • سال: 

    1386
  • دوره: 

    13
تعامل: 
  • بازدید: 

    591
  • دانلود: 

    142
چکیده: 

در این مقاله روش جدیدی برای خوشه بندی کلمات به منظور ساخت مدل زبانی n-gram برای زبان فارسی ارایه شده است که در آن مشکل پیچیدگی روش های خودکار و سرگشتگی بالای روش های دستی به حداقل رسیده است. در این روش هر کلمه با یک بردار ویژگی نمایش داده می شود که این بردار معرف امار مقوله های نحوی مربوط به آن کلمه است. سپس بردارهای حاصل با استفاده از الگوریتم k-means خوشه بندی می شوند، پیاده سازی و آزمایش های مربوط بر روی پیکره متنی زبان فارسی که شامل حدود 10 میلیون کلمه می باشد، صورت گرفته است. نتایج بیانگر کاهش 34 درصدی در سرگشتگی و کاهش 16 درصدی در نرخ خطای بازشناسی نسبت به روش های دستی مبتنی بر مقوله های نحوی است.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 591

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 142
اطلاعات دوره: 
  • سال: 

    1382
  • دوره: 

    9
تعامل: 
  • بازدید: 

    434
  • دانلود: 

    116
چکیده: 

مدل مخلفی مارکف یکی از روشهای پر استفاده در بازشناسی گفتار است و در اغلب موارد کارایی خوبی از خود نشان داده است. استفاده از شبکه عصبی نیز در سیستم های شناسایی الگو متداول می باشد و در بازشناسی گفتار نیز بکار گرفته شده است. از آنجایی که هر یک از این دو روش دارای نقاط ضعف و قوتی می باشند، به منظور بهره گیری از نقاط قوت مدل مخفی مارکف و شبکه های عصبی، یک مدل هیبرید متشکل از مد مخفی مارکف پیوسته و شبکه عصبی نگاشت خودسازمانده برای مدل کردن واجها پیاده سازی و برای بازشناسی گفتار پیوسته مورد استفاده قرار داده ایم و توانسته ایم با استفاده همزمان از بردارهای وزن شبکه عصبی و توابع چگالی احتمال مدل مخفی مارکف، راندمان سیستم هیبرید را نسبت به سیستمی که تنها با استفاده همزمان از بردارهای وزن شبکه عصبی و توابع چگالی احتمال مدل مخفی مارکف، راندمان سیستم هیبرید را نسبت به سیستمی که تنها از مدل مخفی مارکف استفاده شده است، بطور متوسط تا حدود 1.6 درصد بهبود بخشیم. در سیستم هیبریدی که برای بازشناسی گفتار پیوسته و مستقل از گوینده زبان فارسی پیاده سازی نمودیم در بهترین حالت و بدون استفاده از مدل های زبانی دقت 56.8 درصد را در سطح جمله بدست آورده ایم.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 434

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 116
litScript
telegram sharing button
whatsapp sharing button
linkedin sharing button
twitter sharing button
email sharing button
email sharing button
email sharing button
sharethis sharing button